메뉴

#모델 성능

TD
The Decoder 42일 전
IMP 8

동일한 요금제, 더 높은 실사용료…오퍼스 4.7 토큰 소모 증가

Anthropic의 최신 모델인 Opus 4.7은 전 모델(4.6)과 동일한 API 요금을 유지하고 있으나, 실제 요청당 토큰 소모량이 평균 30% 이상 증가해 전체 사용 비용이 크게 상승하는 것으로 나타났습니다. 코드 생성 작업에서 특히 토큰 낭비가 심하며, 80턴 기준 약 20~30%의 추가 비용이 발생할 것으로 추정됩니다. 그러나 지시 사항 준수 성능(IFEval 기준)은 이전 버전 대비 약 5%p 향상되어 기능적 개선은 이루어진 것으로 확인됩니다.

Anthropic Opus 4.7 토큰 비용
SG
r/singularity 44일 전
IMP 6

클로드 오푸스 4.7, 벤치마크서 4.6보다 성능 역행

클로드 오푸스 4.7이 '주제 일반화 벤치마크(Thematic Generalization Benchmark)' 테스트에서 예상과 달리 이전 버전인 4.6보다 낮은 점수를 기록했습니다. 모델이 제시된 예시에서 구체적인 제약 조건을 잊고 더 포괄적이지만 틀린 패턴을 선택하는 오류를 보였으며, 이는 모델 업데이트 과정에서 추론 및 맥락 파악 능력의 퇴화 가능성을 시사합니다.

클로드 오푸스 4.7 벤치마크